#include <stdio.h>
#include "cuda.h"

using namespace cuda;


__global__ void add (int a, int b, int* c) {
  *c = a + b;
}

#define DIM 1024

void test () {
  CPUBitmap bitmap(DIM, DIM);

  int h_a;
  int* d_a;
  cudaMalloc(&d_a, 4);
  add<<<1,1>>>(2, 7, d_a);
  cudaMemcpy(&h_a, d_a, 4, cudaMemcpyDeviceToHost);
  cudaFree(d_a);
  log_i("2 + 7 = %d", h_a);
}



int main () {
  Env env;
  env.log();
  test();
  return 0;
}